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요 약 
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다 음 에 요 청 될 블 록 을 정확하게 예 측 한다. 본 논 문 의 선 반 입 시 스 템 은 일반 파 일 시 스 템 에 비해 최고 40% 의 
옹 답 속도 향 상 을 가 져 오 며 , 기 존 의 지 식 기반 선 반 입 기 법 에 비해 뛰어난 메모리 효 율 성 을 보여준다. 
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1. 서 론 


멀티미디어 웹 서 버 나 대규모 과학 계 산 용 응 용 프 
로 그 램 이 요 구 하는 파 일 이나 데 이 터 의 크 기 가 지속 
적 으 로 증 가 하고 있다. 또한, 네트워크 대 역 폭 의 확 
대 와 컴퓨터 시 스 템 의 처리 능 력 이 중 가 함에 따라 
파일 입출력 요 구 량 도 따라서 중 가 하고 있 다 [1]. 그 
리고 멀티미디어 데 이 터 와 같은 대용량 데 이 터 들 은 
재 사 용 성 이 거의 없어 한번만 요 청 되어 사용되고 더 
이상 요 청 되지 않는 데이터 블 록 이 대 부 분 이다. 이로 
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인해서 파일 버퍼 캐 쉬 의 적 중 률 이 감 소 하 고 있다. 
이러한 액세스 패턴 하에서 버퍼 캐시 적 중 를 을 향상 
시키기 위해서는 파일 블록 선 반 입 기 법 의 중 요 성 이 
커지고 있다. 

파일 블록 선 반 입은 응 용 프 로 그 램 이 데 이 터 를 액 
세 스 하기 전에 웅 용 프 로 그 램 이 요청할 것으로 예측 
되는 데이터 블 록 을 미리 디 스 크 에 서 읽어서 버퍼 
캐 쉬 에 저 장 함 으로써 버퍼 캐 쉬 의 적 중 률 을 향 상 시 
킨다. 그리고 응용 프 로 그 램 의 읽기 요 청 을 디 스 크 에 
서가 아닌 버퍼 캐 쉬 로 부터 해당 데이터 블 록 을 읽어 
옴 으로 해서 전체 파일 시 스 템 의 웅 답 속 도 를 향 상 시 
킬 수 있다. 

하지만, 파일 블록 선 반 입 역시 디스크 입출력 대 
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역 폭 을 차 지 하 기 때문에, 선 반 입 한 데이터 블 록 이 사 
용 되지 않는다면 디스크 입출력 대 역 폭 을 낭 비 하 는 
것이 된다. 또한 선 반 입 한 데이터 블 록 을 저 장 하 기 
위해 캐시 버 퍼 에 서 제 거 된 데이터 블 록 에 대한 액세 
스가 발 생 한 다면 이를 다시 디 스 크 에서 읽 어 와야 하 
므로, 이 중 으로 디스크 입출력 대 역 폭 을 낭 비 하게 될 
뿐만 아니라 캐시 적 중 률 을 저 하 시켜 파일 시 스 템 의 
웅 답 속 도가 떨어지게 된다. 따라서 미 래 에 사용될 데 
이터 블 록 에 대한 예측 정 확 도 가 높지 않다면 선 반 입 
은 오히려 파일 시 스 템 의 성 농 을 저 하 시키게 된다. 

이러한 정 확 하 지 못한 선 반 입 에 의해 성 능 이 저하 
되는 것을 해 결 하기 위해 응 용 프 로 그 램 의 액 세 스 를 
예 측 하 여 선 반 입을 수 행 하기 위한 연 구 가 있어 왔다 
[2-4]. 본 논 문 에서는 지능적 액세스 패턴 예측 방법 
의 관 점 에서 새로운 선 반 입 기 법 인 616 기 법 을 이용 
한 선 반 입 시 스 템 올 제 안 한 다. 일반적인 응 용 프로그 
램 의 액세스 패 턴 은 이 전 에 나타난 액세스 패 턴 을 
다시 나타낼 가 능 성 이 높다는 가정 하에서, 51< 기 법 
은 이 전 에 나타난 액세스 패 턴 을 사 용 하여 선 반 입을 
수 행 한다. 

81( 기 법 은 변 화 가 심한 액세스 패 턴 이 아니라 액 
세스 패 턴 에 규 칙 성 이 있는 파 일 에 대해 선 반 입 을 
수 행 한다. 이러한 규 칙 성 이 있는 액 세 스 는 일반적인 
0 써 % 파일 시 스 템 [5] 이 나 과학 기술 계 산 을 위한 병 
렬 처리 시 스 템 [6,7] 등 다 수 의 시 스 템 에서 평 균 적 으 
로 80% 이상의 액 세 스 를 차 지 한 다. 또한 일 반 적 으로 
액 세 스 되는 웹 페 이 지 의 액세스 패 턴 이 일정한 패턴 
을 가지고 있다고 가 정 할 때 51( 기 법 은 이런 웹 의 
액세스 패 턴 을 기 록 하 여 다음 액세스 때에는 이 정보 
를 바 탕 으로 웹 서 버 의 응 답 속 도 를 향 상 시킬 수 있는 
웅 용 에도 이 용 될 수 있다. 

따라서, 51( 기 법 은 일반적인 파일 입출력 요 청 이 
나 웹 페이지 요 청 이 있을 때 규 칙 성 이 있는 액세스 
패 턴 에 대해서 선 반 입 할 수 있다면 충분한 성 능 향상 
을 이룰 수 있게 된다. 

981020 는 패턴 정보 저 장 의 공간 효 율 성 을 보 완 한 
것으로 액세스 정 보 의 메모리 사 용 량 을 줄일 수 있게 
액 제 스 의 반 복 성 올 이용한다. 이 시 스 템 은 510 선반 
입 기 법 을 수 행 하기 위해서 516 액세스 패 턴 을 수집 
하는 액세스 패턴 수 집 기 와 수 집 된 액세스 패 턴 을 
사 용 해 서 선 반 입을 수 행 하는 선 반 입 실 행 기 의 두 부 
분 으로 구 성 된 다. 그리고 이 시 스 템 은 저장된 액세스 


패턴 정 보 룰 이용한 웅 용 프 로 그 램 의 옹 답 속 도의 향 
상 뿐 아니라 반 복 적 인 액세스 패 턴 의 정 보 를 압축 
저 장 하는 기 법 으로 기존 시 스 템 에 비해 뛰어난 메모 
리 사용 효 율 을 보여준다. 

본 논 문 은 서 론 에 이어 2 장 에서는 파일 액세스 패 
턴 연구 및 기 존 의 선 반 입 정책 연 구 에 대해 알 아 보 
고 기존 연 구 의 문 제 점 을 고 찰 한다. 3 장 에서는 본 논 
문 에서 제 안 하는 새로운 선 반 입 시 스 템 인 51<26 에 
대해 알아보고 4 장 에서는 구 현 된 선 반 입 시 스 템 의 
성 능 을 평 가 하기 위해 기 존 의 파일 액세스 패턴 연구 
에서 알려진 액세스 패 턴 올 사 용 해 서 실 험 한 결 과 를 
제 시 한 다. 마 지 막 으로 5 장 에서는 실험 결 과 를 바탕 
으로 결 론 을 내리고 앞 으 로 의 과 제 를 제 시 한다. 


2. 파일 선 반 입 기법 


캐 쉬 사 용 은 파 일 접 근 의 지 역 성 이 클 경우 입출력 
횟 수 를 줄 임 으로써 파일 블 록 들의 빠른 접 근 을 가능 
하게 한다. 하지만 사 용 되 는 파 일 의 크 기 가 점점 커 
지고 한 번만 읽 혀 지는 데이터 블 록 들의 중 가 로 캐쉬 
의 효율성 문 제 가 발 생 한 다 [81. 이런 한 계 를 보 완 하 
기 위해 앞으로 사용될 블 록 들을 미리 가 져 오는 선반 
입 기 법 은 디 스 크 에 대한 접근 시 간 을 줄이는 좋은 
방 법 이 된다 

대표적인 선 반 입 정 책 에 는 (08(006 81006 Ｌ00- 
20680) 과 131.001870166 81006 1.00311680) 같 은 알고 
리즘 선 반 입 정 책 과 액세스 패 턴 을 이용하는 지 식 기 
반의 선 반 입 으 로 구 분 된 다 [9]. 이 선 반 입 기 법 들 에 대 
해 알 아 보 면 다 음 과 같다. 

08Ｌ 은 가장 대표적인 선 반 입 정 책 으로서 08 ㅅ 
(0068100 ㅠ ^10630) 라 고 불 리 기 도 한다. 08Ｌ 선 반 입 
정 책 은 현재 읽 기 가 요 청 된 블 록 의 다음 블 록 을 선반 
입 하 는 방 법 으로 파 일 의 블 록 을 차 례 대로 액 세 스 하 
는 순 차 적 인 액 세 스 가 많은 경 우 에 효 과 적 이다. 

18Ｌ 은 08Ｌ 을 확 장 한 선 반 입 정 책 으로 읽 기 가 요 
청 된 블 록 의 다음 블 록 부터 순 차 적 으로 디 스 크 버 퍼 
가 허 락 하는 한도 내 에 서 최대한 선 반 입 을 수 행 한다. 
18Ｌ 은 순 차 적 인 액 세 스 가 대부분인 경우, 그리고 입 
출 력 이 많은 웅 용 프 로 그 램 의 경 우 에 효 과 적 이다. 즉 , 
18Ｌ 은 입출력 요 구 가 많은 상 황 에서는 한번에 선반 
입 하 는 양 을 늘 임 으 로 써 저 장 장 치 의 지 연 시 간 에 의 
한 오 버 헤 드 를 줄일 수 있어 08Ｌ 보 다 높은 성 능 을 
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낸다. 

이들 선 반 입 기 법 에서는 대 부 분 의 액 세 스 가 순차 
적 액세스 패 턴 이거나 910216-910060 액세스 패 턴 에 
서는 충분한 성능 향 상 을 기대할 수 있 다 [10]. 

하지만, 최근 대용량 데 이 터 를 요 구 하 는 멀 티 미 디 
어나 웹 서버 같은 웅 용 프 로 그 램 의 액세스 패 턴 이 
이 전 에 비해 점차 복 잡 해 지고 있어서 08Ｌ 이 나 13Ｌ 
의 적 용 이 어 려 워 지 고 있다. 따라서 최 근 에 는 웅 용 프 
로 그 램 의 액세스 패 턴 올 사 용 하여 선 반 입을 수 행 하 
는 지 식 기 반 의 선 반 입 기 법 으로써 선 반 입 의 정확성 
을 향 상 시키고 선 반 입 을 적 용 할 수 있는 액세스 패턴 
의 범 위 를 확 대 하기 위한 연 구 가 활 발 하게 진 행 되고 
있다. 

웅 용 프 로 그 램 의 액세스 패 턴 을 사 용 해 서 선 반 입 
의 정 확 성 을 향 상 시키는 방 법 에는 크게 두 가지 방법 
이 있다. 하 나 는 웅 용 프 로 그 램 이 앞으로 사 용 하 게 될 
블 록 에 대한 정 보 를 파일 시 스 템 에 제 공 함 으로써 파 
일 시 스 템 이 이 정 보 를 사 용 하여 선 반 입을 수 행 하 는 
' 따 -68560 선 반 입 기 법 ' 이 고, 또 다른 하 나 는 파일 
시 스 템 에서 웅 용 프 로 그 램 의 액세스 패 턴 을 분 석 하 
여 다 음 에 액 세 스 할 블 록 을 예 측 하고 이에 따라 선반 
입을 수 행 하는 ' 지 능 적 액세스 패턴 예측 방 법 ' 이 다 
[1811]. 

110(-68560 선 반 입 기 법 은 ' 웅 용 프 로 그 램 의 앞 으 
로의 액 세 스 를 가장 잘 알고 있는 것은 웅 용 프로그램 
자 신 이 다 .' 라는 가정 하에서 웅 용 프 로 그 램 이 앞으로 
액 세 스 하게 될 블 럭 에 대한 정 보 를 41 마 라고 하는 
규 정 된 형 식 의 데 이 터 로 작 성 하여 특별한 ^ ㅁ 를 사 
용 해 서 파일 시 스 템 에 제 공 한다. 파일 시 스 템 은 제공 
된 111 다 를 바 탕 으로 앞으로 사 용 하게 될 블 럭 을 최소 
의 오 버 헤 드로 선 반 입을 수 행 할 수 있는 방 법 으로 
선 반 입을 수 행 하 게 된다. 

향상된 선 반 입을 사 용 하 기 위한 10【- ㅁ 08560 선반 
입 기 법 의 단 점 은 \10-08500 선 반 입 기 법 올 위한 
웅 용 프 로 그 램 의 재 작 성 같은 시스템 외적인 오 버 혜 
드가 크고, 기 존 의 표준 입출력 ^7 ㅁ 를 사 용 해 서 작성 
된 웅 용 프 로 그 램 의 경 우 에 는 성 능 을 향 상 시킬 수 없 
다는 것이다. 이러한 410【-08560 선 반 입 기 법 의 단점 
을 해 결 하기 위해 파일 시 스 템 이 응 용 프 로 그 램 의 액 
세스 패 턴 을 분 석 하 여 미 래 의 액 세 스 를 예 측 하고 선 
반 입 을 수 행 할 수 있는 지능적 액세스 패턴 예측 방 
법 에 대한 연 구 가 있어 왔다. 


기 존 의 지 농 적 액세스 패 턴 예 측 방 법 에서는 액세 
스 패 턴 이 가지는 반 복 성 에 상 관 없 이 액세스 패턴 
정 보 를 기 록 하였기 때문에 액세스 패턴 정 보 의 길이 
가 파 일 의 길 이 에 비 례 해서 커 지 게 된다. 따라서 점 
점 파 일 의 크 기 가 커지고 있는 현 재 의 상 황 에서는 
액세스 패 턴 정 보가 차지하는 저 장 장치 사 용 량 이 증 
가하게 된다. 이러한 문 제 점 을 해 결 하기 위해서는 액 
세스 패턴 정 보 의 크 기 를 줄일 수 있는 방 법 이 필요 
하다. 

다음 장 에서는 이런 문 제 를 해 결 하기 위해 파 일 의 
액 세 스 가 반 복 적 인 패 턴 일 때는 액세스 패 턴 의 정보 
를 압 축 하여 저 장 하는 6126-10667781-(04 파 액세스 
패턴 기 반 의 선 반 입 시 스 템 에 대해 알 아 본다. 


3. 6810 선 반 입 시스템 


이 장 에서는 616 선 반 입 기 법 을 수 행 하기 위한 
816756 의 구 조 와 510[5 를 구 성 하는 액세스 패턴 수 
집 기 와 선 반 입 실 행 기 의 구조 및 세부 모 듈 의 작 동 에 
대해 설 명 한 다. 


3.1 5616 선 반 입 시스템 구조 


81(8 는 616 선 반 입 기 법 을 수 행 하 기 위해서 파 
일 액세스 패 턴 을 수 집 하여 516 액세스 패턴 정 보 로 
저 장 하는 액세스 패턴 수 집 기 와 수 집 된 액세스 패턴 
을 사 용 해 서 선 반 입 을 수 행 하 는 선 반 입 실 행 기 의 두 
부 분 으로 구 성 된 다. 

액세스 패턴 수 집 기 는 응 용 프 로 그 램 의 읽기 액세 
스 를 수 집 해서 610 액세스 패턴 정 보 의 형 태 로 작성 
해서 파 일 로 저 장 한다. 액세스 패턴 정 보 를 메 모 리 에 
저 장 하지 않고 파 일 로 저 장 하는 것은 시스템 리셋 
등에 의해 액세스 패턴 정 보 가 소 실 되는 것을 방 지 하 
기 위 해 서 이다. 

816 선 반 입 기 법 은 지식 기반 선 반 입 방 법 의 일종 
이기 때문에 액세스 패턴 정 보 가 축 적 될수록 선 반 입 
의 정 확 성 이 향 상 되게 된다. 만약, 시 스 템 을 리 셋 할 
때 마 다 액세스 패턴 정 보 를 새로 수 집 해 야 한다면 시 
스템 가동 초 기 에는 선 반 입 의 성 능 이 저 하 되거나 선 
반 입 을 수 행 할 수 없게 되어 시 스 템 의 파일 입출력 
성 능 이 저 하 되게 된다. 

선 반 입 실 행 기 는 파 일 로 저장된 액세스 패턴 정보 
를 메 모 리 로 읽 어 들여 선 반 입 을 수 행 하 게 된다. 파일 
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로 저장된 액세스 패턴 정 보 가 여러 개 존 재 한다면 
선 반 입 실 행 기 는 모든 액세스 패턴 정 보 를 읽 어 들 여 
서 웅 용 프 로 그 램 의 액 세 스 와 비 교 해 서 일 치 하 는 액 
세스 패 턴 을 제외한 나머지 액세스 패 턴 을 메 모 리 에 
서 제 거 하게 된다. 

그림 1 은 51085 의 구 조 를 보 여 주 고 있다. 


사용자 레벨 


커널 레 별 


그림 1. 9106 (610 『「0 하 아 109 57516170) 의 구조 


3.2 510 기 반 의 선 반 입 기법 


8106 는 지식 기반 선 반 입 방 법 을 기 반 으로 한다. 
즉 , 어떤 파 일 을 6068 해 서 01056 할 때 까 지 의 읽기 액 
세 스 를 시간 순 서 대로 기 록 해 서 저장해 두고, 이후 
파일 액세스 시 에 는 과 거 에 기 록 된 액세스 순서 정보 
와 현 재 의 액세스 패 턴 을 비 교 해 서 다 음 에 액 세 스 할 
데이터 블 록 을 예 측 하는 방 법 이다. 이러한 방 법 의 문 
제 점이 패 턴 정보 저 장 의 공간 효 율 성 을 보 완 하기 위 
해 61(075 에 서는 액세스 패턴 정 보 의 메모리 사용량 
을 줄이는 액 세 스 의 반 복 성 을 사 용 하였다. 

액 세 스 의 반 복 성 이란 그림 2 와 같이 파 일 을 액세 
스 할 때 전체 파 일 을 연 속 적 으로 액 세 스 하는 것이 
아니라 일 정 량 의 데 이 터 를 읽고 나서 일정 부 분 을 
뛰 어 넘고 다시 일 정 량 의 데 이 터 를 읽 어 들 이 는 액세 
스 패 턴 이 반 복 적 으로 발 생 하는 것을 의 미 한다. 


[0 읽은 부분 
[위지 않은 부분 


동일한 액 세 스 가 반 북 왼 다. 


그림 2. 액 세 스 의 반복 


81085 에 서는 파 일 에 대한 액 세 스 를 기 록 할 때, 전 
체 액 세 스 를 기 록 하지 않고 반 복 단 위 를 구 성 하는 읽 
은 부 분 의 크 기 (9280 와 읽은 부 분 과 다음 읽은 부분 


사 이 의 간 격 (1066081), 그리고 이 반 복 단 위 의 반 복 회 


수 (00000 를 기 록 함 으로써 전체 액 세 스 를 기 록 하는 
것에 비해 액세스 패턴 정 보 의 크 기 를 줄이고 있다. 

선 반 입 수행 시 에 는 이와 같이 기 록 된 616 액세스 
패턴 정 보 를 응 용 프 로 그 램 의 액 세 스 와 비 교 해 서 다 
음 에 발생할 액 세 스 를 예 측 한다. 과 거 에 발생한 액세 
스 패턴 정 보 와 현재 웅 용 프 로 그 램 이 액 세 스 하는 것 
을 비 교 하여 현재 요 청 된 액 세 스 에 뒤 이 어 서 발생할 
액 세 스 를 과 거 에 발생한 액 세 스 와 동 일 할 것이라고 
가 정 하고 이 액 세 스 들이 웅 용 프 로 그 램 에서 요 청 하 
기 전에 선 반 입 하 여 캐시 버 퍼 에 저 장 하는 것이다. 

응 용 프 로 그 램 의 액 세 스 가 과 거 와 동 일 하다면 이 
러한 예 측 방 법 은 캐시 적 중 률 을 1009 에 가깝게 향 
상 시 킬 수 있고, 비 슷 하 더라도 어느 정 도 의 성능 향 
상이 있게 된다. 또한, 과 거 의 액 세 스 와 현 재 의 액세 
스가 다 르 다 면 이러한 예 측 방 법 은 선 반 입 의 정확성 
을 저 하 시키게 되므로, 계속 현 재 의 액 세 스 와 과 거 의 
액 세 스 를 비 교 하여 일 치 하는지 확 인 하고, 일 치 하지 
않는다면 선 반 입을 중 지 시킴으로써 파일 입출력 성 
능이 저 하 되는 것을 막는다. 


3.3 510 액 세 스 - 패 턴 수집기 
3.3.1 510 액세스 패턴 수집 기법 


파일 액세스 패턴 수 집 이란 웅 용 프 로 그 램 의 액세 
스 를 발생 순 서 에 따라 기 록 하여 선 반 입을 수 행 하기 
위해 필요한 액세스 패턴 정 보 의 형 태 로 만드는 작업 
을 말한다. 

81(: 액세스 패턴 정 보 는 . 패 턴 테 이 블 ( ㅁ 27'.286662 ㅁ 
73116) 의 패턴 테이블 엔 트 리 (『\1, 2306600 10116 
100) 형 태 로 기 록 되게 되는데 27 안 의 27 순서 
에 따라 시 간 적 인 순 서 를 나타낸다. 즉 , 앞 부 분 에 기 
록 된 21 ㅠ 가 뒷 부 분 에 기 록 된 ?1 ㅠ 에 비해 시 간 적 으 
로 앞서 발생한 것이다. 

그림 3 에 서 이 용 된 5, 는 ( 시 간 에 서 의 읽기 요청 크 
기를 나타내며, Ｌ 는 [- ㄱ 1 시 간 에 서 의 읽기 요 청 이 수행 
종 료 되었을 때 의 오 프 셋 과 [ 시 간 에 서 의 읽기 요 청 이 
시작될 때 의 오 프 셋 간 의 거리, 즉 읽기 요 청 간의 거 
리 를 나타낸다. 8 ㅁ 는 1 번 째 액세스 패 턴 의 읽기 크 
기를 나타내고, Ｌ ㅁ 와 6 ㅁ 는 각각 1 번 째 의 액세스 
패 턴 의 읽기 액 세 스 간 의 거 리 와 액세스 패 턴 의 반복 

수 를 의 미 한 다. 

이와 같은 하 나 의 패 턴 이 파 일 의 처 음 부터 끝까지 
반 복 해 서 발 생 한 다면 610 액세스 패턴 정 보 는 하나 
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다 워 은 부분 


[여지 않은 부분 


『156 


505, 
16051, 
ㅇ 063 


그림 3. 실제 액세스 인 자 와 6|( 액세스 패턴 정보 인 자 의 
관계 


의 71 로 모든 액 세 스 를 나 타 내 게 된 다. 

81( 액 세스 패턴 수 집 의 방 법 은 크게 단순 반복 액 
세스 패턴, 이중 반복 액세스 패 턴 의 두가지 형 태 로 
나타난다. 이중 반복 액세스 보다 더 복잡한 형 태 의 
액세스 패턴 즉 , 반 복 성 을 가지지 않는 패 턴 과 같은 
형 태 의 액세스 패 턴 을 가지는 응 용 프 로 그 램 의 존재 
는 그리 많지 않다. 또한 삼중, 사중 반복 액세스 패턴 
을 압 축 해서 기 록 하는 것은 오히려 오 버 헤 드 가 되어 
액세스 패턴 수 집 의 성 능 을 저 하 시킨다. 


3.3.2 액세스 패턴 수집기 


액세스 패턴 수 집 기 는 웅 용 프 로 그 램 의 읽기 액세 
스 를 관 찰 하 여 51 액세스 패턴 정 보 의 형 태 로 수집 
하고 디 스 크 에 파 일 로 저 장 하는 역 할 을 수 행 한다. 웅 
용 프 로 그 램 의 읽기 액 세 스 를 관 찰 하기 위해서는 파 
일 시 스 템 의 인터페이스 부 분 에 위 치 하 게 된다. 

그림 4 는 액세스 패턴 수 집 기 의 세부 구 조 를 보여 
준다. 액세스 패턴 수 집 기 는 액세스 패턴 초기화 모 
듈 , 액세스 패턴 압축 기록 모듈, 액세스 패턴 저장 
모 듈 의 주요 모 듈 로 구 성 되어 있고 부 가 적 으 로 파일 
객체 내에 액세스 패턴 정 보 를 수 집 하기 위한 액세 
스 패턴 배 열 을 가지고 있다. 

핵 세스 패턴 수 집 기 의 각 모 듈 들 사 이 에는 상 호 작 
용이 없도록 설 계 되었으며 각 모 듈 들은 오직 웅 용 프 
로 그 램 의 파일 6 ㅁ 680, 1080, 01056 요 청 에 연 계 되어 동 
작 한다. 

(1) 액세스 패턴 초기화 모듈 

액세스 패턴 초기화 모 듈 은 웅 용 프 로 그 램 이 파일 
0060 을 호 출 하면 파일 시스템 내 부 에 생 성 되 는 파일 


1) 웅 용 프 로 그 램 이 파 일 을 60800 하 면 생 성 되 고 01056 하 면 소 
멸 되 는 커널 내의 객체. 파 일 의 10, 오프셋, 파 일 의 속성 
등 의 정 보 를 가진다. 


액세스 빠 턴 수집기 
억세스 빼 턴 초기화 
티스 수 
0 


그림 4. 액세스 패턴 수 집 기 의 구조 


객 체 에 액세스 패 턴 올 기 록 할 수 있는 액세스 패턴 
배 열 을 생 성 하고 초 기 화 한다. 

610 선 반 입 기 법 을 적 용 하기 위한 대 상 은 파 일 을 
여러 번 에 걸쳐서 액 세 스 할 정도로 큰 파 일 이다. 따 
라서, 파 일 의 크 기 가 정해진 최소 크 기 보다 커 야 만 
액세스 패턴 초기화 모 듈 에서 액세스 패턴 배 열 을 
초 기 화 한다. 만약 기준 이 하 의 크 기 를 가진 파 일 이라 
면 액세스 패턴 초기화 모 듈 은 액세스 패턴 배 열 올 
초 기 화 하지 않고 이를 액세스 패턴 압축 기록 모 듈 과 
액세스 패턴 저장 모 듈 에 알린다. 

정해진 최소 크 기 보다 큰 파 일 이라면 액세스 패턴 
초기화 모 듈 은 액세스 패턴 배 열 을 생 성 한다. 이매, 
생 성 하 는 액세스 패턴 배 열 의 길 이 는 정해진 최대 
액세스 패턴 길 이 이다. 

(2) 액세스 패턴 압축, 기록 모듈 

응용 프 로 그 램 이 파일 시 스 템 에 읽기 요 청 을 하면 
액세스 패턴 압축, 기록 모 듈 은 액세스 패턴 배 열 에 
시간 순 서 대로 기 록 하 게 된다. 이때, 액세스 패턴 정 
보 의 길 이 를 줄이기 위해서 3 장 에서 언 급 한 5[(: 액 
세스 패턴 수 집 방 법 을 사 용 하여 액세스 패턴 정 보 를 
압 축 하 여 기 록 한 다. 

기 록 하 는 액세스 패 턴 의 길 이 가 최대 제한 배열 
개 수 를 넘게 되면 이러한 액세스 패 턴 은 불규칙한 
핵 세스 패 턴 으로 판 단 하여 더 이상 액세스 패턴 수집 
을 수 행 하지 않는다. 또한 불규칙한 액세스 패 턴 으로 
판 단 되었을 경 우 에 는 수 집 된 액세스 패턴 정 보 를 저 
장 하 지도 않는다. 따라서 이러한 액세스 패 턴 에 대해 
서는 516 선 반 입 기 법 을 적 용 하지 않게 된다. 그럼 
5 는 액세스 패턴 압축 기록 모 듈 의 동 작 과 정 을 순서 
도로 나타낸 것이다. 

(3) 액세스 패턴 저장 모듈 

액세스 패턴 저장 모 듈 은 응용 프 로 그 램 이 파 일 에 
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처음 액 세 스 인 가? 앞 액세스 패 턴 과 비교 
예 
새로운 액세스 패턴 아니오 120, 101614810 
구 조 체 에 기록 일 치 하 논 가? 
예 


앞 액세스 패턴 구 조 체 와 일 치 하는 
그 이 전 의 액세스 패턴 구조체 검색 
- 병 위 는 2 개 앞 부 터 제한 범 위 까지 


일 치 하 는 구조체 
존 재 하는가? 


현재 액세스 패턴 구 조 체 의 
0040 1 증 가 


그림 5. 액세스 패턴 압축 기록 모 듈 의 동작 


대한 01086 를 요 청 하면 수 집 된 액세스 패 턴 을 디스크 
에 저 장 한다. 그럼 6 은 액세스 패턴 저장 모 듈 의 동작 
과 정 올 순 서 도 로 나타낸 것이다. 

다양한 액세스 패 턴 을 가지는 파 일 에 대해서는 여 
러 개의 액세스 패턴 정 보 를 유 지 하여 선 반 입 실행기 
에서 이를 사 용 하여 선 반 입을 실행할 수 있도록 하는 
것이 선 반 입 의 성 능 을 향 상 시킬 수 있지만, 너무 많 
은 액세스 패턴 정 보 를 저장해 두는 것은 디 스 크 의 
저 장 공 간 을 많이 사 용 하게 되고, 선 반 입 실 행 기 에서 
사용할 때도 많은 메 모 리 를 사 용 하기 때문에 오 버 헤 
드가 커진다. 또한, 여러 개의 액세스 패턴 정보 중에 
서 자주 나타나는 것은 소 수 이고 나 머 지 는 매우 드 몰 
게 발 생 한 다면 드물게 발 생 하는 액세스 패턴 정 보 는 
제 거 하는 것이 디스크 공간 절약 면 에 서 이 점 을 가 
진다. 


그림 6. 액세스 패턴 저장 모 듈 의 동작 


따라서, 저장할 수 있는 액세스 패턴 정 보 의 개수 
를 제 한 해야만 하는데, 이렇게 되면 액세스 패턴 정 
보 간 의 교체 정 책 이 필 요 하 다. 즉 새로운 액세스 패 
턴 을 기 록 하기 위해서 이 전 에 저장된 액세스 패턴 
정보 중에서 앞으로 나타날 확 률 이 가장 작은 패 턴 을 
선 별 하여 제 거 할 수 있는 방 법 이 필 요 하다는 것이다. 
본 논 문 에서는 이러한 교 체 정 책 으 로 180 정 책 을 사 
용 하 였다. 14"0 정 책 은 각 액세스 패 턴 의 발 생 회 수 를 
기 록 하 고 그 중에서 가장 작은 발 생 회 수 를 가지는 
액세스 패 턴 을 제 거 하고 새로운 액세스 패 턴 을 기록 
하는 방 법 을 말한다. 

그림 7 은 여러 개의 액세스 패턴 정 보 를 디 스 크 에 
저장할 때 의 파 일 들 의 계 충 구 조 를 보여준다. 00 ㅁ - 
100478000 파 일 은 각 액세스 패턴 정 보 의 파일 이름 
과 각 액세스 패턴 정 보 의 발 생 회 수 에 대한 정 보 를 
가지고 있다. 또한, 최대 허용 액세스 패턴 정 보 의 
수도 포 함 하고 있다. 현재 저장된 액세스 패턴 정보 
의 수가 최대 허용 액세스 패턴 정 보 의 개 수 와 같다 
면 새로운 액세스 패턴 정 보 를 저 장 하기 위해서는 
액세스 패턴 정보 중에서 가장 발 생 회 수가 작은 액세 
스 패턴 정 보 를 제 거 하고 새로운 액세스 패턴 정 보 를 
기 록 한 다. 


<600119478100 1116 


뷔 ×0417 타 씨 4 


『0816014 0 


발 생 회수 6330>0>0 


새로운 패 턴 이 추 가 될 때 
ㅁ 8『6「02 가 제 거 된다. 


그림 7. 액세스 패턴 정 보 의 저장 구조 


3.4 선 반 입 실행기 


선 반 입 실 행 기 는 웅 용 프 로 그 램 이 파 일 을 008 ㅁ 하 
면 이 전 에 저장된 액세스 패턴 정 보 를 1080 하 여 이 
정 보 를 사 용 해 서 선 반 입을 수 행 한다. 선 반 입을 수행 
하기 위해서는 선 반 입 의 대 상 과 시기, 선 반 입 할 데이 
터 양 을 결정할 수 있는 방 법 이 필 요 하다. 이러한 방 
법 은 앞에서 언 급 한 616 선 반 입 기 법 에 의해 결 정 되 
고 선 반 입 실 행 기 는 이에 맞추어 선 반 입을 수 행 한다. 

그림 8 은 선 반 입 실 행 기 의 세부 구 조 와 선 반 입 실 
행 기 의 주요 모 듈 인 액세스 패턴 1080 모듈, 액세스 
패턴 비교 모듈, 610 선 반 입 실행 모듈, 084 ㅅ 선 반 입 
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실행 모 듈 올 보 여 주 고 있다. 

각 모 듈 들은 웅 용 프 로 그 램 의 파일 0060, 1680 요 
청과 연 계 되 어 동 작 한 다. 

웅 용 프 로 그 램 이 파일 0060 을 요 청 하 면 액세스 패 
턴 1030 모 듈 은 저장된 액세스 패턴 정 보 를 모두 읽어 
들여서 파일 객 체 의 내 부 에 저 장 한다. 파일 7680 를 
요 청 하면 616 선 반 입 실 행 기 는 516 선 반 입 기 법 에 
따라 선 반 입 을 실 시 한 다. 액세스 패턴 비교 모 듈 은 
여러 액세스 패 턴 을 가지는 파 일 의 경 우 에 1030 된 액 
세스 패 턴 과 현 재 의 웅 용 프 로 그 램 의 액 세 스 를 비교 
하여 일 치 하 지 않는 액세스 패턴 정 보 를 선 별 하여 
메 모 리 에 서 제 거 한 다. 08 ㅅ 선 반 입 실행기 모 듈 은 
액세스 패턴 정 보 가 존 재 하 지 않거나 이 전 에 기 록 된 
액세스 패턴 정 보 와 다른 액세스 패 턴 이 관 찰 되어 
816 선 반 입을 실행할 수 없는 경 우 에 선 반 입을 실행 
한다. 파일 01056 가 요 청 되면 파일 객 체 가 메 모 리 에 
서 삭 제 되면서 516 선 반 입 실행 모 듈 과 액세스 패턴 
비교 모듈, 그리고 084 선 반 입 모 듈 은 그 파 일 에 
대한 수 행 을 중 지 한 다. 


그림 8. 선 반 입 실 행 기 의 구조 


3.4.1 액세스 패턴 1080 모듈 


웅 용 프 로 그 램 이 파일 0067 을 요 청 하 면 저 장 되 어 
있는 액세스 패턴 정 보 를 읽 어 들여 파일 객체 내 부 에 
저 장 한 다. 또한 액세스 패턴 정 보 에 기 록 된 발 생 회 수 
역시 읽 어 들인다. 

액세스 패턴 발 생 회 수 는 선 반 입 에 사용할 액세스 
패턴 정 보 가 다수 존 재 하 고 아직 어느 액세스 패턴 
정 보 가 현 재 의 액 세 스 와 일 치 하는지 알 수 없을 때 
선 반 입 에 사용할 액세스 패턴 정 보 를 선 택 하기 위한 


기 준 이 된다. 610 선 반 입 기 법 에서는 이러한 액세스 
패턴 정 보 중에서 가장 발 생 회 수 가 많은 액세스 패턴 
정 보 가 현 재 의 액 세 스 와 일 치 할 가 능 성 이 높다고 보 
고 이 액세스 패턴 정 보 를 사 용 해 서 선 반 입을 수 행 한 다. 


3.4.2 액세스 패턴 비교 모듈 


여러 개의 액세스 패턴 정 보 를 파일 객 체 에 읽어 
들 였 을 때, 이 중에서 현 재 의 응 용 프 로 그 램 의 액세스 
패 턴 과 일 치 하 는 액세스 패 턴 정 보 를 선택할 필 요 가 
있다. 액세스 패턴 비교 모 듈 은 응용 프 로 그 램 의 읽 
기 요 청 이 있을 때 마 다 파일 객 체 의 액세스 패턴 정 
보 와 비 교 하 여 일 치 하지 않는 액세스 패턴 정 보 를 
파일 객 체 에서 제 거 한 다. 따라서 현 재 까 지 의 웅 용 프 
로 그 램 의 읽기 요 청 과 일 치 하 는 액세스 패턴 정 보 만 
이 파일 객체 내에 남아 있게 된다. 610 선 반 입 실행 
기 모 듈 은 남아 있는 액세스 패턴 정 보 중에서 가장 
발 생 회 수가 많은 액세스 패턴 정 보 를 사 용 해 서 선반 
입을 수 행 하게 된다. 

모든 액세스 패턴 정 보 가 파일 객 체 에서 제 거 되었 
다면 이것은 현 재 의 응 용 프 로 그 램 의 액 세 스 가 새로 
운 액세스 패 턴 이라는 뜻 이므로 액세스 패턴 비교 
모 듈 은 이것을 액세스 패턴 수 집 기 에 알 려 서 액세스 
패턴 수 집 기 가 응 용 프 로 그 램 이 파 일 을 01056 하 면 새 
로운 액세스 패턴 정 보 로 디 스 크 에 저 장 하도록 한다. 
그림 9 는 액세스 패턴 비교 모 듈 의 동 작 과 정 을 순서 
도로 나타낸 것이다. 


아 니 오 … 핵 세스 패턴 정보 
메 모 리 에 존 재 하 는 그 
예 


의 26 와 1016048: 을 각 액세스 패턴 정 보 와 비교 
일 치 하지 않는 액세스 패턴 정 보 는 제거 


지세 스 파타 고부 아니오] 616 선 반 입 16806 
5002 


그림 9. 액세스 패턴 비교 모 듈 의 동작 


3.4.3 516 선 반 입 실행기 모듈 
선 반 입 실 행 기 에서 가장 중요한 부 분 이다. 516 선 
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반입 실행기 모 듈 은 파일 객 체 에 존 재 하는 액세스 
패턴 정보 중에서 가장 발 생 회 수 가 많은 액세스 패턴 
정 보 를 사 용 하여 선 반 입을 수 행 한다. 이 때, 사 용 하 
는 선 반 입 기 법 은 앞에서 언 급 한 5 선 반 입 기 법 올 
사 용 한 다. 

파일 객 체 에 액세스 패턴 정 보 를 액세스 패턴 비 
교 모 듈 에서 모두 제 거 했 거나 이 전 에 기 록 된 액세스 
패턴 정 보 가 없다면 51 선 반 입 . 기 법 은 적 용 할 수 
없다. 이러한 경 우 에는 084 선 반 입 실 행 기 가 선반 
입을 수 행 하게 된다. 

웅 용 프 로 그 램 이 파 일 을 01086 할 때 까지 파일 객체 
에 액세스 패턴 정 보 가 남 아 있다면 이것은 응 용 프로 
그 램 의 액 세 스 가 액세스 패턴 정 보 와 일 치 한다는 뜻 
이므로 액세스 패턴 정 보 의 발 생 회 수 를 1 중 가 시 킨 
다. 반대로 파일 객 체 에 액세스 패 턴 정 보 가 남 아 있지 
않다면 이것은 웅 용 프 로 그 램 의 액 세 스 가 현 재 까지 
나타나지 않은 새로운 액세스 패 턴 이 라는 뜻 이므로 
현재 저장된 액세스 패턴 정 보 의 수가 최대 허용 액 
세스 패턴 정 보 수 와 같 다 면 가장 발 생 회 수 가 작은 
액세스 패턴 정 보 를 제 거 하고 새로운 액세스 패턴 
정 보 를 기 록 하고, 최대 허용 액세스 패턴 정보 수보 
다 작 다 면 새로운 액세스 패턴 정 보 를 저 장 하고 
00008148000 파 일 에 등 록 한 다. 


4. 실험 및 성 능 평가 


이 장 에서는 리눅스 86 상 에 구 현 된 561(45 의 
성 능 을 실 험 한 결 과 를 제 시 한다. 


4.1. 실험 환경 

81068 는 리눅스 운 영 체 제 의 커널 2.2.17 을 수 정 하 
여 구 현 하 였다. 

사 용 된 시 스 템 의 사 양 은 다 음 과 같다. 


(0020 펜 티 엄 프로 20042 
트 ^1664 32543 6100 
801386 삼성 2.102 80080 ㅁ 2000 019 


성능 실 험 을 위해 응 용 프 로 그 램 의 액세스 패 턴 을 
다 음 과 같이 선 정 하 였다. 
패턴 1: 순 차적, 읽기, 10008 


패턴 3:6102016-5001060, 읽기, 10058, 
패턴 3: ㅜ 73000, 원기, 1005448, 1-502 680, 


1800010 15606 


패턴 1 은 일반적인 시 스 템 의 파일 액 세 스 의 대부 
분 을 차지하는 순차적 읽 기 를 사 용 하여 일반적인 액 
세스 패 턴 에 서 의 성 능 을 비 교 하기 위한 것이다. 패턴 
2 는 병렬 처리 과학 기술 계산 응 용 에서 자주 나타나 
는 패 턴 으로 일반적인 08Ｌ 나 18Ｌ 에 서는 선 반 입 을 
수 행 할 수 없는 패 턴 으로서 새로운 선 반 입 정 책 이 
어느 정 도 의 성능 향 상 을 보이는 지를 알 아 보 기 위한 
것이다. 패턴 3 은 패 턴 을 기 록 할 수 없는 패 턴 을 사용 
하여 제 안 된 선 반 입 정 책 이 이러한 패 턴 에 대해서는 
성 능 이 좋지 않 음 을 보이기 위한 것이다. 


4.2 610 선 반 입 인자 


최 적 의 성 능 을 내는 선 반 입 양과 선 반 입 윈 도 우 의 
크 기 는 파일 입출력 시 스 템 의 성 능 과 캐시 버 퍼 의 
크기 등 의 실제 시 스 템 의 성 능 에 의해 결 정 된 다 . 

본 논 문 에서는 실 험 적 으로 최 적 의 성 능 이 얻 어 지 
는 선 반 입 양 을 구했다. 실 험 에 의해 결정된 최 적 의 
선 반 입 양은 읽기 크 기 (5126) 가 1 ㅁ 0286(=4) 이하 
일 때는 20286(=82) 이고, 읽기 크 기 가 10886 보 다 
클 때는 읽기 크 기 의 2 배 이다. 이보다 적은 양 을 선반 
입 하 게 되면 캐시 적 중 률 이 저 하 되 게 되고, 이보다 
많이 선 반 입 하 게 되면 캐시 적 중 률 은 거의 같지만, 
처음 액 세 스 가 시작될 때, 선 반 입 에 걸리는 시 간 이 
길 어 져 서 첫 번째 읽기 요 청 에 대한 웅 답 시 간 이 길어 
진다. 

- 본 논 문 에서 실 험 적 으로 알 아 낸 최 적 의 선 받 입 시 
기가 되는 선 반 입 윈 도 우 의 크 기 는 선 반 입 양 의 3 배 
이다. 이보다 더 작은 크 기 에서는 캐시 적 중 률 이 - 저 
하 되 고 응 용 프 로 그 램 의 수 행 속 도 가 떨 어 졌 고, 이보 
다 더 큰 크 기 에 서는 캐시 적 중 률 은 거의 일 정 하지만 
응 용 프 로 그 램 의 첫 번째 읽기 요청 시 에 선 반 입 하 는 
양 이 많 아 져서 웅 답 속 도 가 떨 어 졌 다. 


4.3 실험 결과 


610: 선 반 입 기 법 은 이 전 에 저장된 액세스 패턴 정 
보 와 동일한 액세스 패 턴 에 대해서만 선 반 입을 수행 
할 수 있다. 실 험 에서는 각 액세스 패 턴 에 대해 한 
번의 실 행 을 거쳐서 액세스 패턴 정 보 를 수 집 할 수 
있도록 하고 실 험 을 실 시 하였다. 

선정한 각 액세스 패 턴 에 대해 5 회 의 측 정 을 실시 
하였고 이 중에서 최 대 와 최 소 를 제거한 나머지 3 회 
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의 측 정 값 을 평 균 해서 결 과 를 도 출 하였다. 비 교 대상 
이 되는 정 책 은 리 눅 스 의 08 정 책 으 로서 081Ｌ 정 
책 의 변 형 이다. 리눅스 (784 정 책 은 순차적 읽 기 에 
최 적 화 되어 있고 순차적 읽 기 가 계 속 되 면 선 반 입하 
는 크 기 를 늘 리 며 , 정해진 크기 이상의 1566(( 가 발생 
하면 선 반 입을 중 지 한다. 이 후 에 ^ 읽 기 가 감지 
되면 다시 선 반 입 하 는 크 기 룰 조 늘 려 간 다. 


4.3.1 순차적 액세스 패턴 

순차적 읽기 액세스 패 턴 에 대해 리 눅 스 의 선 반 입 
과 구 현 된 선 반 입 정 책 을 적 용 하여 실 험 을 실 시 하였 
다. 테스트 프 로 그 램 은 한번에 1<8-641 크 기 를 파 
일 의 처 음 부터 끝까지 순 차 적 으로 읽었다. 

표 1 은 순차적 읽기 액세스 패 턴 에 대한 수행 시간 
을 읽 어 돌 이는 단 위 를 162 에 서 642 까 지 변 화 시키 
면서 측 정 한 결 과 이다. 그림 10 은 표 1 의 결 과 를 그래 
프로 나타낸 것이다. 

표 2 는 이 실 험 에서 측 정 된 캐시 적 중 률 로 서 선반 
입 의 정 확 성 을 보 여 주 고 있다. 

그림 10 에 서 볼 수 있듯이 468 이 하 의 읽기 크기 


표 1. 순차적 읽기 수행 시간 결 과 ( 단 위 : 은 


읽기 크기 


그림 10. 순차적 읽기 수행 시간 


에서는 거의 같은 성 농 울 내 지 만 그 이상의 크 기 에 대 
해서는 최소 16% 에 서 최대 27% 의 성능 향 상 이 있음 
을 확인할 수 있다. 

또한, 수행 시 간 이 162 에 서 480 까지는 급격히 
감 소 하다가 460 이 후 에 는 거의 일정한 것을 볼 수 
있는데, 이것은 리 눅 스 에서 사 용 하는 최소 입출력 단 
위 가 480 이 기 때 문 이 다. 즉 , 1< 를 4 번 연속 접 근 하 
는 것은 4608 크 기 를 4 번 접 근 하는 것과 같기 때문에 
4 배 정 도 의 시 간 이 걸리게 된다. 하지만 468 크 기 를 
넘는 액 세 스 의 경 우 에는 이러한 중복 접 근 이 발 생 하 
지 않기 때문에 읽 어 들 이 는 크 기 가 같 다 면 거의 같은 
시 간 이 걸리게 된다. 

표 2 에 나타난 바와 같이 리 눅 스 의 선 반 입 정 책 은 
순차적 읽 기 에 최 적 화 되어 있어서 96% 이 상의 캐시 
적 중 률 을 유 지 하는 것을 알 수 있다. 또한, 제안한 
981(: 정 책 에서는 순 차 적 인 액세스 패 턴 에 대해 거의 
1008% 에 가까운 확 률 로 캐시 적 중 률 올 향 상 시킬 수 
있 음 을 확인할 수 있다. 


4.3.2 912702016-5001060 액세스 패턴 


으 00!6 91060 패 턴 은 과학 기술 계 산 을 위한 병 
렬 웅 용 프 로 그 램 에서 발 견 되는 액세스 패 턴 으 로서 
일정한 길 이 의 액 세 스 와 일정한 길 이 의 1666 을 반복 
하는 것이다. 여 기 에 서 는 1666 거 리 를 고 정 하 고 읽 
기 의 크 기 를 변 화 시켜서 그 결 과 롤 관 찰 하였다. 

표 3 은 1660 거 리 를 4096607[6 로 고 정 하고 읽기 크 
기를 168 에 서 64《2 까 지 변 화 시키면서 그 읽 기 에 

린 수 행 시 간 을 기록한 것이다. 표 4 는 캐쉬 적중률 
을 기록한 것이고 그림 11 은 수 행 시 간 을 그 래 프 로 
나타낸 것이다. 

결 과 에서 알 수 있듯이 1166 간 격 이 크기 때문에 
리 눅 스 의 08 ㅅ 는 수 행 시 간 과 캐시 적중률 모 두 에 서 
성 능 이 저 하 되 었다. 하지만, 91(: 정 책 에 서는 상대적 
매우 높은 확 률 로 다음 블 럭 을 선 반 입 함 을 알 수 있 
다. 리 눅 스 의 084 ㅅ 에서는 캐시 적 중 률 이 최저 33.46% 
까지 하 락 하였지만 616 정 책 에서는 대 부 분 의 읽기 
크 기 에서 99% 이상의 캐시 적 중 률 을 보이고 있다. 
또한, 읽기 수행 시 간 에 서도 최 소 17% 에 서 최대 432 
까지 성 농 이 향 상 되 었다. 

여 기 에 서도 읽기 크 기 가 커 짐 에 따라 순차적 읽기 
에 가까워 져서 리 눅 스 의 0824 선 반 입 정 책 의 캐시 
적 중 률 이 상 숭 하 는 것을 볼 수 있다. 
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표 3. 4096 616 611060 에 서 의 읽기 수행 시 간 (단위 : 초 ) 


| 단 위 : 초 |146812608|46081860811608[3208|6498| 


516 90060 히 978 11024 937| 8939! 951| 909| 9.465| 


표 4. 4096 66 51060 패 턴 에 서 의 캐시 적 중 를 
(단위: %) 


| 다 워 1% |146812608|4608[8608|16081349816408 


0006 084177.4914171133.46166.71183.39|91.68|96.53 
1610 501606199.63198.46|99.09199.70|99.21199.82|99.79 


띠 

ㅜ 10 

즈 0 8 

자 6 
4 


: 읽 기 크기 
그림 11. 4096 61060 패 턴 에 서 의 읽기 수행 시간 


4.3.3 2-1 ㅁ 0 8600060 액세스 패턴 


2-10 6004060 패 턴 은 과학 기술 계 산 을 위한 대용량 
병렬 프 로 그 램 에서 발 견 되는 것으로 910016 501060 
패 턴 에 비 해 서 는 발 견 되 는 확 률 이 적다. 이 실 험 에서 
는 1~-10 91000!6 901060 패 턴 보 다 복잡한 패 턴 을 선반 
입 할 수 있는지 검 중 하기 위하여 사 용 되 었 다. 실 험 에 
사 용 된 패 턴 은 468 의 1668( 과 162 의 읽 기를 50 회 
반 복 하 고 8《2 의 1566( 과 8《2 의 읽 기를 50 회 반 복 하 
는 것을 교 대 로 나 타 나 도록 설 정 하였다. 

표 5 와 표 6 은 각각 수행 시 간 과 캐시 적 중 률 을 
기록한 것이다. 

이 실 험 에서도 616 정 책 은 리눅스 08 ㅅ 에 비해 
34% 정 도 의 성능 향 상 을 보여준다. 또한, 캐시 적중 
률 에 있어서도 리눅스 082 ㅅ 가 72% 에 그친 반 면 에 
99% 에 가까운 성 능 을 보이고 있다. 


5. 결론 및 향후 과제 


현 재 의 파일 액세스 패 턴 은 멀티미디어 파 일 의 중 


표 5. 2- ㅁ 61060 패 턴 에 서 의 읽기 수행 시 간 (단위 : 초 ) 
| 1 | 2 | 3 희 | 4 의 | 5 희 | 평균 | 


916 54806 | 974| 96611024| 99211033| 998 


표 6. 2-0 61060 패 턴 에 서 의 캐시 적 중 율 (단위 : %) 


ㅣ | 18 | 2 희 | 3 희 | 4 희 | 5 희 | 평균 | 


| 006 084 | 
98.52199.12|98.66| 98.98 
가와 네트워크 대 역 폭 의 확 대 에 따라 대 용 량 의 파일 
이 중 가 하 고 재 사 용 의 빈 도 는 감 소 하고 있다. 이러한 
상 황 에서는 캐시 적 중 률 이 감 소 하 게 된다. 캐시 적중 
률 을 향 상 시키기 위해서 선 반 입 의 필 요 성 이 높아지 
고 있지만, 잘못된 선 반 입은 파일 입 출 력 의 성 능 올 
저 하 시 키 게 된다. 

따라서 정확한 선 반 입 을 통해 파일 입 출 력 의 성능 
을 향 상 시키기 위한 목 적 으로 웅 용 프 로 그 램 의 액세 
스 패 턴 에 따라 동 적 으로 선 반 입 을 수 행 하는 지식 
기반 선 반 입 방 법 이 고 안 되었다. 하지만, 기 존 의 지 
식 기반 선 반 입 방 법 은 응 용 프 로 그 램 의 액세스 패턴 
정 보 를 저 장 하는데 필요한 메모리 공 간 이 파 일 의 길 
이에 비 례 해 서 커지는 문 제 점 이 있다. 

본 논 문 에서 제 안 하는 816 선 반 입 시 스 템 은 이전 
에 수 행 된 파일 액세스 패 턴 에 관한 연 구 에 의해 알 
려진 파일 액세스 패 턴 의 반 복 성 을 기 반 으로 하여 
액세스 패턴 정 보 를 압 축 해 서 저 장 함 으 로써 지식 기 
반 선 반 입 방 법 의 성 능 을 그대로 유 지 하 면서 메모리 


ㆍ 사 용 량 올 줄 였 고 수 집 된 액세스 패턴 정 보 를 디스크 


에 파 일 로 저 장 함 으로써 지식 기반 선 반 입 방 법 의 
문 제 점 인 시스템 리셋 등에 의해 수 집 된 액세스 패턴 
정 보 가 소 실 되는 문 제 를 개 선 하였다. 또한, 액세스 
패턴 정 보 를 메 모 리 에 캐시 해 눔 으로써 파일 6060 시 
에 선 반 입 수 행 을 위해 액세스 패턴 정 보 를 읽 어 들이 
는 오 버 헤 드 를 경 감 시켰다. 

실험 결 과 에서 알 수 있듯이, 현재 가장 많이 사용 
되고 있는 084 선 반 입 기 법 이 순차적 액세스 패턴 
에 대해서만 충분한 성 능 을 보여주는데 비해서 제안 
하는 51( 선 반 입 기 법 은 순차적 액 세 스 를 포 함 해서 
9000016~501060 액세스 패 턴 에 대해서도 선 반 입을 수 
행 해 서 성 능 을 향 상 시킬 수 있다. 

현재 510468 는 과 거 에 나타난 액세스 패 턴 과 동일 
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한 액 세 스 에 대해서만 선 반 입을 수 행 할 수 있다. 향 
후 과 제 로는 과 거 의 액세스 패 턴 과 완전히 동 일 하 지 
는 않지만 거의 유사한 액 세 스 에 대해서도 선 반 입을 
적 용 할 수 있는 방 법 에 대한 연 구 가 필 요 하 다. 
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